Data augmentation(数据增强):在机器学习/深度学习中,通过对已有训练数据进行有控制的变换或扩展(如翻转、裁剪、加噪、同义改写等),生成“新”的训练样本,以提高模型泛化能力、缓解过拟合,并在数据量不足或类别不平衡时提升效果。(在不同领域也可指“数据扩充/增广”,含义相近。)
Data augmentation helps the model learn from more varied images.
数据增强能帮助模型从更多样的图像中学习。
By applying random rotations, color jitter, and mixup, the team used data augmentation to reduce overfitting and improve accuracy on the validation set.
通过随机旋转、颜色扰动和 mixup,这个团队使用数据增强来减少过拟合,并提高验证集上的准确率。
/ˈdeɪtə ˌɔːɡmɛnˈteɪʃən/
data 源自拉丁语 datum(“给出的东西”,dare“给予”的过去分词),在现代英语中常指“数据/资料”。
augmentation 来自拉丁语 augmentare(“增加、扩充”),与英语动词 augment(增加)同源。合在一起即“对数据进行扩充/增广”。